Les itemsets essentiels fermés : une nouvelle représentation concise

نویسندگان

  • Tarek Hamrouni
  • Islem Denden
  • Sadok Ben Yahia
  • Engelbert Mephu Nguifo
  • Yahya Slimani
چکیده

Résumé. Devant l’accroissement constant des grandes bases de données, plusieurs travaux de recherche en fouille de données s’orientent vers le développement de techniques de représentation compacte. Ces recherches se développent suivant deux axes complémentaires : l’extraction de bases génériques de règles d’association et l’extraction de représentations concises d’itemsets fréquents. Dans ce papier, nous introduisons une nouvelle représentation concise exacte des itemsets fréquents. Elle se situe au croisement de chemins de deux autres représentations concises, à savoir les itemsets fermés et ceux dits essentiels. L’idée intuitive est de profiter du fait que tout opérateur de fermeture induit une fonction surjective. Dans ce contexte, nous introduisons un nouvel opérateur de fermeture permettant de calculer les fermetures des itemsets essentiels. Ceci a pour but d’avoir une représentation concise de taille réduite tout en permettant l’extraction des supports négatif et disjonctif d’un itemset en plus de son support conjonctif. Un nouvel algorithme appelé D-CLOSURE permettant d’extraire les itemsets essentiels fermés est aussi présenté. L’étude expérimentale que nous avons menée a permis de confirmer que la nouvelle approche présente un bon taux de compacité comparativement aux autres représentations concises exactes.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Tmd-Miner : Une nouvelle approche pour la détection des diffuseurs dans un système communautaire

Résumé. Plusieurs méthodes ont été développées ces dernières années pour détecter, dans un réseau social, les membres qualifiés, selon les auteurs, d’influenceurs, de médiateurs, d’ambassadeurs ou encore d’experts. Dans cet article, nous proposons un nouveau cadre méthodologique permettant d’identifier des diffuseurs dans le contexte où seule l’information sur l’appartenance des membres du rése...

متن کامل

Vers une nouvelle approche d'extraction des motifs séquentiels non-dérivables

Résumé. L’extraction de motifs séquentiels est un défi important pour la communauté fouille de données. Même si les représentation condensées ont montré leur intérêt dans le domaine des itemsets, à l’heure actuelle peu de travaux considèrent ce type de représentation pour extraire des motifs. Cet article propose d’établir les premières bases formelles pour obtenir les bornes inférieures et supé...

متن کامل

Suppression des Itemsets Clés Non-Essentiels en Classification basée sur les Règles d'Association

Résumé. En classification basée sur les règles d’association, les itemsets clés sont essentiels : la suppression des itemsets non clés n’affecte pas la précision du classifieur en construction. Ce travail montre que parmi ces itemsets clés, on peut s’intéresser seulement à ceux de petites tailles. Plus loin encore, il étudie une généralisation d’une propriété importante des itemsets non clés et...

متن کامل

Nouvelle représentation concise exacte des motifs corrélés rares : Application à la détection d'intrusions

Résumé. La fouille des motifs corrélés qui sont très peu fréquents est une problématique de plus en plus intéressante dans la fouille de données. Dans ce cadre, les motifs corrélés rares selon la mesure de corrélation bond ont été étudiés dans un récent travail. La représentation concise exacte RMCR de l’ensemble de ces motifs a été alors proposée. Toutefois, aucun algorithme n’a été proposé po...

متن کامل

Description structurelle automatique de documents musicaux

Une nouvelle méthodologie d’extraction de motifs répétés au sein de partitions musicales est présentée. L’automatisation de la recherche de répétitions permet un approfondissement de l’analyse musicale, et rend possible la conception d’outils de gestion des masses de données musicales. L’approche proposée consiste en une explicitation des facteurs de redondance structurelle sousjacents à une te...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007